#!/usr/bin/perl
#Le but de ce programme est la recherche et l'extraction des patrons définis dans le fichier "patrons.txt".
#entrée: résultat_udpipe.txt et patrons.txt
#sortie: fichier contenant les séquences définies

open my $termino, "$ARGV[1]";
@patrons=<$termino>;
close $termino;
#my $suitedepos="DET NOUN VERB";

open my $entree, "$ARGV[0]";
@pos=();
@token=();
while (my $ligne=<$entree>) {

	next if $ligne=~m/^#|\d+-\d+/ ;
	$ligne=~s/\r?\n//g;
	if ($ligne ne "") {
	my @ligne = split /\t/, $ligne;
	push @pos, $ligne[3];
	push @token, $ligne[1];
	#my $rep=<STDIN>;
	}

	else {
	#print "je traite les listes\n";
	#print "@pos\n";
	#print "@token\n";
	foreach my $suitedepos (@patrons) {
		$long=0;
		$suitedepos=~s/\r?\n//g;
		while ($suitedepos=~/ /g) {$long++}
		$i=0;
		foreach my $element (@pos) {
			$i++;
			if ($suitedepos =~/^$element/) {
			#print "presence de $element, je cherche toute la séquence de $i et ensuite sur $long caractères\n";
			$suite="";		
			for ($j=$i-1;$j<=$long+$i-1;$j++) {$suite=$suite.$pos[$j]." "}
			#print "==>$suite<==\n";
			#print "==>$suitedepos<==\n";
			if ($suite=~/$suitedepos/) {
				
				#print "MATCH de $i à $j\n";
				#print "@token[$i-1..$j-1]\n";
				$extract = join(" ", @token[$i-1..$j-1]);
				$dict{lc($extract)}++;
				print "$extract\n";
					}
				}
			}
		}
	#my $rep=<STDIN>;
	@pos=();
	@token=();
	}
}
